서울시 치안데이터 분석

“CCTV가 많으면 범죄율을
낮추는 데에 도움이 될까요?”

출처: 서울시 공공데이터포털 (https://data.seoul.go.kr/)

데이터 살펴보기
TOP 3
    자치구       총생활인구수
16  송파구  753278.4966
0   강남구  633521.1274
3   강서구  533814.0426
TOP 3
    자치구   1인가구수
4   관악구  150745
3   강서구  104509
16  송파구   87140

데이터 살펴보기
자치구
강남구    7007
관악구    5366
서초구    5060
Name: count, dtype: int64
자치구
강남구    1713
용산구    1421
구로구    1372
Name: count, dtype: int64

안전벨과 CCTV의 상관관계: 0.3032
예상과 달리, CCTV와 안전벨의 상관관계가 높지 않다.

데이터 살펴보기

치안센터와 경찰관 수의 상관관계: 0.6500
다른 변수들과 비교했을 때 가장 높은 상관관계를 보임

데이터 살펴보기
    자치구  술집 수
17  양천구  3094
7   금천구  3179
10  동작구  3276
     자치구  술집 수
12  서대문구  3578
7    금천구  3179
14   성동구  4001

술집 수와 총 범죄 건수의 상관계수: 0.8354
다른 변수들과 비교했을 때, 가장 높은 상관관계를 보임

상관계수 분석

범죄건수 주요 변수

  • 술집 수
  • 생활 인구 수
  • 구별 경찰 수
  • CCTV 총 수량
  • 1인가구수

회귀분석

상관 관계 높은 변수 임의 선택

VS Stepwise로 변수 선택

서울시 치안 기준 군집화

상관계수가 높은 변수를 활용해서,

비슷한 치안 특성을 가진 구를 찾기위해

저희는 K-Means 클러스터링을 사용했습니다.

K-Means 클러스터링이란?

유사한 특성을 가진 데이터를 자동으로 그룹으로 묶는 비지도 학습 기법

  • 사용자가 군집 개수(K)를 정하면,

  • K개의 중심점을 기준으로 데이터를 그룹화하고,

  • 각 데이터를 가장 가까운 중심점에 할당합니다.

  • 중심점을 반복적으로 조정하며 유사한 데이터끼리 묶는 군집을 만듭니다.

서울시 자치구별 ‘구별_경찰수’, ‘유흥업소_개수’, ‘총생활인구수’, ‘cctv’ 등을 기준으로 치안 특성이 비슷한 지역을 자동으로 군집화하기 위해 사용했습니다.

하지만 분석 결과는…?

군집 개수를 2개로 정하고 군집 분석을 수행했습니다.

자치구 총범죄건수 자치구코드 총생활인구수(내) 총생활인구수(외) 총생활인구수 범죄율 구별 경찰수 Unnamed: 8 일반음식점_개수_x ... 총_개수 cctv 남자 여자 파출소수 일반음식점_개수_y 유흥업소_개수_y 총 음식점 수 클러스터
1 강동구 6325 11740 520769.7605 8995.2846 529765.0451 119.392551 753 NaN 3977 ... 4076 3191 62943 29123 33820 9 3977 99 4076 0
2 강북구 5456 11305 294508.1488 7027.3157 301535.4645 180.940574 663 NaN 3335 ... 3404 2858 52659 24116 28543 9 3335 69 3404 0
4 관악구 9249 11620 459691.4819 22747.9824 482439.4643 191.713172 901 NaN 4852 ... 5048 5366 150745 79518 71227 9 4852 196 5048 0
5 광진구 6139 11215 360329.9580 24158.1353 384488.0933 159.666843 723 ` 4278 ... 4288 4091 71959 34355 37604 10 4278 10 4288 0
6 구로구 6816 11530 380846.3092 38602.9220 419449.2312 162.498808 743 NaN 4048 ... 4080 4050 61318 29957 31361 8 4048 32 4080 0
7 금천구 4438 11545 192123.9921 19587.2685 211711.2606 209.625127 570 NaN 3135 ... 3179 2725 52033 27499 24534 5 3135 44 3179 0
8 노원구 6800 11350 499720.4215 5255.8342 504976.2557 134.659797 791 NaN 3724 ... 3745 2655 65275 27648 37627 8 3724 21 3745 0
9 도봉구 3569 11320 273860.3099 3059.2624 276919.5723 128.882187 557 NaN 2280 ... 2300 1598 41525 18400 23125 8 2280 20 2300 0
10 동대문구 6164 11230 321124.3994 23509.1311 344633.5305 178.856654 796 NaN 3971 ... 4023 2857 70959 34960 35999 11 3971 52 4023 0
11 동작구 6121 11590 368749.7562 14213.0818 382962.8380 159.832741 661 NaN 3234 ... 3276 2650 74443 35650 38793 7 3234 42 3276 0
13 서대문구 4376 11410 327715.6130 19941.4783 347657.0913 125.871156 651 NaN 3550 ... 3578 3223 56170 24297 31873 8 3550 28 3578 0
15 성동구 4490 11200 302502.4326 13575.1242 316077.5568 142.053743 620 NaN 3981 ... 4001 4036 48111 23464 24647 9 3981 20 4001 0
16 성북구 4989 11290 415834.2999 14721.2824 430555.5823 115.873541 905 NaN 4025 ... 4033 3943 69148 30867 38281 10 4025 8 4033 0
18 양천구 5820 11470 376331.9216 4939.3425 381271.2641 152.647224 734 NaN 3090 ... 3094 3845 47106 21436 25670 8 3090 4 3094 0
20 용산구 6242 11170 255885.5460 15046.6725 270932.2185 230.389727 765 NaN 5161 ... 5182 1078 42482 19436 23046 7 5161 21 5182 0
21 은평구 6292 11380 452860.8658 6072.2302 458933.0960 137.100594 906 NaN 3842 ... 3918 4111 68850 29345 39505 9 3842 76 3918 0
24 중랑구 6454 11260 362285.8875 6590.8484 368876.7359 174.963595 750 NaN 3778 ... 3795 3471 66906 32454 34452 8 3778 17 3795 0

17 rows × 21 columns

군집1
['강남구' '강서구' '마포구' '서초구' '송파구' '영등포구' '종로구' '중구']
군집2
['강동구' '강북구' '관악구' '광진구' '구로구' '금천구' '노원구' '도봉구' '동대문구' '동작구' '서대문구' '성동구'
 '성북구' '양천구' '용산구' '은평구' '중랑구']

군집간 총 범죄 건수 시각화(Boxplot)

군집간 총 범죄건수의 평균에 차이가 있다.

군집 분석으로 알 수 있는 것
클러스터 구별 경찰수 총 음식점 수 총생활인구수 파출소수 총범죄건수
1 734.65 3824.71 377,246.14 8.41 5867.06
2 1058.38 7468.25 464,404.93 12.38 9337.38
클러스터 1 분석
  • 복잡하고 밀도 높은 지역일 가능성이 크다.
  • 인구가 많고 상권이 크며 → 유동인구도 많고 외부 유입도 활발하다.
  • 경찰과 파출소 수도 많아 → 치안 자원이 이미 많이 투입된 상태다.
  • 그럼에도 불구하고 범죄 건수가 높다.
클러스터 0 분석
  • 클러스터 1보다 평균적으로 수치가 낮다.
  • 도시 외곽 또는 상대적으로 조용한 주거 지역일 가능성이 있다.
  • 인구도 적고 음식점도 적으며, 경찰/파출소 수도 적다.
  • 그에 따라 범죄 건수도 낮다.